Estimation de similarité entre séquences de descripteurs à l'aide de machines à vecteurs supports

نویسندگان

  • Romain Tavenard
  • Laurent Amsaleg
  • Guillaume Gravier
چکیده

Les bases de données contenant des séquences multimédia se trouvent maintenant partout. Archives de l’INA, balladodiffusion (podcast), production et partage de vidéo font désormais partie de notre quotidien. Faire des recherches par le contenu dans ces bases où l’information est en flux est difficile, notamment à grande échelle. Une des questions fondamentales concerne la mesure de similarité entre la séquence requête et celles de la base. Nous proposons dans cet article d’utiliser des SVM pour modéliser chaque séquence et de comparer les modèles pour établir la similarité. Nous comparons cette approche à celle habituelle où l’on utilise l’alignement dynamique de séquences (DTW). Les résultats obtenus sur des données audio réelles montrent l’utilité d’une approche par modèles.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Sélection de modèles par des méthodes à noyaux pour la classification de données séquentielles

Ce travail concerne le développement de méthodes de classification discriminantes pour des données séquentielles. Quelques techniques ont été proposées pour étendre aux séquences les méthodes discriminantes, comme les machines à vecteurs supports, par nature plus adaptées aux données en dimension fixe. Elles permettent de classifier des séquences complètes mais pas de réaliser la segmentation, ...

متن کامل

Classification Automatique Non supervisée de Documents Textuels basés sur Wordnet

Mettre en œuvre l’une des méthodes de classification non supervisée consiste en premier lieu à choisir une manière de représenter les documents (Sebastiani, 2002) ; dans un second temps il faut choisir une mesure de similarité, et en dernier lieu choisir un algorithme de classification que l'on va mettre au point à partir des descripteurs et de la métrique choisis. Tout document dj sera transfo...

متن کامل

Méthodes à noyaux appliquées aux textes structurés

Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants p...

متن کامل

TraMineR: une librairie R pour l'analyse de données séquentielles

TraMineR est une librairie pour l'environnement statistique R destinée à la fouille, la description et la visualisation de séquences d'états ou d'événements, et plus généralement de données séquentielles discrètes. La librairie est librement disponible sur le CRAN http://cran.r-project.org. Elle est principalement conçue pour l'analyse de données biographiques longitu-dinales dans le domaine de...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007